花费 13 ms
机器学习笔记—增强学习

本文介绍增强学习和自适应控制。 在监督学习中,算法是要输出尽量模仿训练集中的标签 y,标签给每个输入 x 一个清楚的正确答案。与此不同,对于许多序列决策和控制问题,就很难对算法给出这种明确的监督。例 ...

Wed Apr 27 18:46:00 CST 2016 0 5159

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM